طراحی و پیاده سازی یک سیستم استخراج اطلاعات با استفاده از روش های تطبیقی برای متون غیر ساخت یافته ی زبان فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر
- نویسنده حمید خدایی
- استاد راهنما محمدرضا مطش بروجردی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1387
چکیده
در پردازش زبان طبیعی، استخراج اطلاعات نوعی بازیابی اطلاعات بوده که قادر به استخراج اطلاعات ساختار یافته از متون فاقد ساختار به وسیله ی الگوهایی از پیش تعریف شده است. در این پروژه، یک روش شبه بی نظارت مبتنی بر خوشه بندی در دو مرحله برای تعیین مناسب بودن، و همچنین طبقه بندی الگوهای استخراج اطلاعات از متن بر اساس نوع آنها طراحی، و برای زبان فارسی پیاده سازی شده است. مرحله ی اول خوشه بندی بر اساس نوع آنها طراحی، و برای زبان فارسی پیاده سازی شده است. مرحله ی اول خوشه بندی بر اساس فرکانس تکرار الگوها و مرحله دوم بر طبق محتویات معنایی آنها انجام می شود که می تواند نوع اطلاعاتی را که هر الگو استخراج می کند نیز به صورت خودکار تعیین کند. آزمایش روش بر روی یک دامنه ی خاص (اخبار زلزله) و یک دامنه ی عمومی تر (اخبار سوانح)انجام یافته و در حالت دامنه ی خاص، چند روش دیگر نیز پیاده سازی شده، و نتایج آنها مورد مقایسه قرار گرفته است. برای پردازش متن، از یک روش تکه سازی مبتنی بر ماشین بردار پشتیبان به همراه الگوریتمی برای تعیین محدوده ی جملات ساده و شکستن جملات مرکب به چند جمله ی ساده استفاده شده است که می تواند یک جمله را به گروه های دستوری تقسیم، و پس از آن، جملات مرکب را به جمله هایی ساده تبدیل نماید. همچنین روش تعیین جزء سخن بر اساس درخت تصمیم نیز استفاده شده است.
منابع مشابه
طراحی و پیاده سازی یک سیستم اطلاعات مکانی مردم گستر برای شبکه آب شهری
در دهههای اخیر محدودیت منابع آب شهری و فرسودگی خطوط انتقال، عمرکوتاه عناصر شبکهی آب، افزایش شکستگی لولهها و تلفات بالای شبکهها سبب افزایش هزینههای اقتصادی و اجتماعی در بهرهوری از زیرساختهای شبکهی توزیع شده است. کمبود اطلاعات، قدمت دادههای مربوط به شبکه و عدم وجود سیستم اطلاعرسانی مکانی حوادث، یکی از بزرگترین مشکلات فراروی مدیریت شبکههای انتقال آب میباشد. گرچه تهیهی اینگونه دادهها...
متن کاملطراحی و پیاده سازی یک سیستم اطلاعات مکانی همراه بافت آگاه برای گردشگران - مطالعه موردی: شهرمراغه
امروزه صنعت گردشگری و جذب گردشگر بهعنوان یکی از منابع اقتصادی در کشورهایی باسابقهی فرهنگی و تاریخی از جمله ایران، مورد توجه بسیار قرارگرفته است. گردشگران نیاز به اطلاعات ساختار یافتهای دارند که در هرلحظه و هر مکان در دسترسشان باشد. این اطلاعات به آن...
متن کاملارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده میشود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند میتواند در یک، چند و یا هیچ دستهای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار میگیرد. این موضوع میتواند در قالب یک ی...
متن کاملارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار می گیرد. این موضوع می تواند در قالب یک ی...
متن کاملطراحی و پیاده سازی یک سیستم کنترل نیمهفعال سازهیی با استفاده از میراگر مغناطیسی جدید
در نوشتار حاضر، یک سیستم نیمهفعال سازهیی با استفاده از یک میراگر مغناطیسی جدید طراحی، ساخته و بر روی یک قاب برشی دو درجه آزادی آزمایشگاهی پیادهسازی شده است. در ابتدا بر پایهی نتایج آزمون، پارامترهای مدل میراگر براساس مدل بوک ـ ون شناسایی شدند. در ادامه، کنترلکنندههای قلاب آسمانی و تناسبی ـ مشتقگیر ـ انتگرالگیر طراحی و بر روی سازه پیادهسازی و عملکرد آنها برای یک زلزلهی نمونه با استفاد...
متن کاملطراحی و پیاده سازی یک سیستم اطلاعات مکانی همراه برای به هنگامسازی اطلاعات شبکه راههای شمال غرب کشور
سیستمهای اطلاعات مکانی همراه از جمله سامانههایی است که با بکارگیری فناوریهای بیسیم، فرآیند اخذ و مدیریت داده مکانی بسیار حجیم در گسترههای جغرافیایی وسیع را متحول نموده و امکان جمعآوری چنین دادهای را در مدت زمان کوتاه و با دقت قابل قبول بویژه در تهیه نقشههای متوسط مقیاس فراهم نموده است. از طرفی، شبکه راهها جزء مجموعه دادههای مکانی است که با توجه به نقش زیربنایی آن در کلیه طرحها و برنامه...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023